训练数据 - 智狐AI导航

CriticGPT

CriticGPT是一种基于GPT-4架构的人工智能模型，专注于审查和识别由大型语言模型生成的代码中的错误。它利用人类反馈强化学习（RLHF）技术，显著提高了代码审查的准确性和效率。CriticGPT具备代码审核、错误识别、安全漏洞分析、反馈生成、性能评估和辅助学习等功能。它通过记录人类评估员故意插入的错误，生成训练数据，并使用近端策略优化（PPO）算法和强制采样波束搜索（FSBS）技术，生成详细

AI项目与工具 2025年06月12日 76 点赞 0 评论 620 浏览

T2V

T2V-Turbo 是一种高效的文本到视频生成模型，能够快速生成高质量视频，同时确保文本与视频的高度一致性。它通过一致性蒸馏技术和混合奖励机制优化生成过程，适用于电影制作、新闻报道、教育及营销等多个领域，支持从创意草图到成品视频的全流程加速。

AI项目与工具 2025年06月12日 16 点赞 0 评论 588 浏览

MATRIX

MATRIX-Gen是一个基于多智能体模拟技术的系统，通过构建虚拟社会生成高质量训练指令数据，用于提升大型语言模型的表现。该工具支持多种应用场景，如软件开发、商业活动、医疗诊断、教育和客户服务，能够显著提高模型在不同领域的性能，并促进其自我进化。

AI项目与工具 2025年06月12日 73 点赞 0 评论 757 浏览

FineWeb 2

FineWeb 2是一个涵盖超过1000种语言的多语言预训练数据集，通过语言识别、去重、内容过滤及PII匿名化处理生成。它支持多种NLP任务，如机器翻译和文本分类，旨在增强多语言模型的性能与普适性，并为研究者提供技术验证的工具与资源。

AI项目与工具 2025年06月12日 16 点赞 0 评论 788 浏览

OmniAlign

OmniAlign-V是由多所高校联合开发的多模态大语言模型对齐数据集，包含约20万个多模态样本，涵盖自然图像和信息图表。其核心功能包括提供高质量训练数据、提升模型的开放式问答能力、增强推理与创造力，并支持模型持续优化。数据集通过图像筛选、任务设计及后处理优化确保数据质量，适用于多模态对话系统、图像辅助问答、创意生成等多个应用场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 686 浏览

Zero123

一种从单个图像到一致的多视图扩散基础模型，旨在使用单视图输入生成 3D 一致的多视图图像。

Ai开源项目 2025年06月05日 19 点赞 0 评论 911 浏览

训练数据

首页

训练数据

列表

默认

浏览次数

发布日期

CriticGPT

T2V

MATRIX

FineWeb 2

OmniAlign

Zero123

训练数据 首页 训练数据

列表 默认 浏览次数 发布日期

CriticGPT

T2V

MATRIX

FineWeb 2

OmniAlign

Zero123

训练数据

首页

训练数据

列表

默认

浏览次数

发布日期